开源

VisionAgents 开源视频AI框架

在这个逐步快速入门指南中,我们将使用 Vision Agents,构建并运行一个 实时语音 AI 代理,该代理可以加入视频/音频通话,通过语音与用户互动,并使用 Google 的 Gemini 音频生成模型 进行响应。

视频 gemini 开源 llm visionagents 2025-10-25 12:00  1

谷歌最强AI,被港科大开源超了?让海外创作者喊出“King Bomb”的P图大杀器来了

机器之心原创编辑:杜伟「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一。随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击。尤其是引领这波多模态生图技术升级潮流的谷歌

谷歌 开源 bomb kingbomb 港科大开源 2025-10-24 14:58  4

开源技术全球协作:从 AI 算法到软件的共享革命

短短一句,像钉子扎进每个打工人的安全感。我们拼命学模型、刷证书、攒项目,却忘了:再锋利的刀,只要刀柄握在别人手里,随时可能调转刀口。于是,全球 1 亿个 GitHub 仓库像 1 亿盏灯,照出另一条路——开源。可灯越亮,影子越长:中国框架、欧洲医疗、硅谷算法,

软件 开源 算法 github 革命 2025-10-24 09:07  5